Note sur une note de bas de page

 D ans le sommaire de la rubrique «Divers», j'indiquais auparavant que

«le nombre de pages [recensées par Google] a franchi “la barre symbolique” (comme l'on dit dans les médias) des trois milliards de pages, fin décembre 2002. Pour anecdote, si l'on consacrait en moyenne trois minutes à chaque page, il faudrait, à dix heures de parcours par jour, et considérant qu'il n'y ait pas de délais d'une page à l'autre, près de 43.000 ans pour tout parcourir…».

En outre, Google ne recense qu'une partie des pages et documents disponibles sur Internet. On peut facilement multiplier ce nombre par trois ou quatre. Disons qu'on y trouve au moins 10 milliards de pages et documents. Il faudrait donc de 130 à 135 millénaires pour accéder à tous.

Ceci donne à réfléchir sur «la Société de l'Information» dont on nous rebat tant les oreilles: factuellement, nous avons à disposition beaucoup plus d'«information» aujourd'hui qu'il y a un siècle, ou qu'il y a seulement vingt ans, effectivement, la capacité moyenne d'un humain à accéder à de l'information n'est pas considérablement plus élevée aujourd'hui qu'il y a vingt ans, ni même qu'il y a un siècle: il faut moins de temps pour trouver l'information (et encore, pas toujours…) mais toujours autant de temps pour la consulter, l'analyser et l'interpréter. Bien sûr, mon évaluation ne tient pas compte des vecteurs d'information électronique autres que l'Internet (chatrooms, forums, newsgroups…), qui pour le moins doivent doubler «l'information» disponible.

Donc, une humaine ordinaire ne pourra pas accéder à toute l'information disponible, sur Internet et dans les librairies, bibliothèques et maisons de la presse, sans compter l'information produite par les entreprises, administrations, associations, organisations SGDG et particuliers. En nous limitant à Internet, que fera notre humaine ordinaire pour trouver de l'information ? D'abord, il se peut qu'elle ait eu connaissance par ouï-dire, par un ouvrage de presse ou de librairie, par un fascicule ou un tract, par une autre page où existe un lien vers lui, d'un site particulier pouvant contenir des informations qui l'intéresseraient; puis elle peut avoir l'idée que telle organisation, tel organisme, tel organe de presse ont un site Internet, et s'arranger de trouver leur adresse; elle aura aussi l'idée d'un sujet sur lequel elle désire avoir des informations, et fera une recherche via un «moteur de recherche» du type Google ou Yahoo ![1], à partir de laquelle elle «butinera», comme disent les Canadiens, elle explorera au hasard les pages trouvées à la recherche d'informations pertinentes sur son sujet. Au hasard ? Certes mais un hasard dirigé…

Contrairement à ce qui se passe dans les interactions réelles entre individus ou celles avec les autres médias de masse (librairie, presse, audiovisuel), actuellement — et probablement pour encore assez de temps — le hasard a une place assez restreinte sur internet. Bien sûr, on peut le provoquer, par exemple en lançant la recherche

 "sexe" OR "amour" 

avec Google et en décidant arbitrairement de visiter ou de télécharger les première, troisième, dixième et trentième références de chacune des 3.443.727 pages que génère la recherche[2]. En outre, on décidera de suivre tous les liens directs qu'on trouvera sur les pages visitées. Pour une investigation hasardeuse moins ambitieuse, on se limitera aux cent premières pages. Autre méthode, à partir d'une page on suit tous les liens, puis les liens existant dans les pages trouvées, cela à l'infini, sans considération du fait qu'on puisse être ou non a priori intéressé par le thème de la page visée. Mon affirmation sur le fait que le hasard a peu de place sur Internet ne considère pas la possibilité réelle d'instaurer une large part de hasard dans ses explorations mais part de ces trois constats simples: l'exploration d'Internet est une activité hautement solipsiste; contrairement à ce qui se passe avec les interactions réelles ou celles avec les mass media «classiques», l'internaute dirige le déroulement de l'interaction; enfin, on se connecte rarement sur Internet sans intention, sans l'idée d'y trouver une chose spécifique.

Je reprécise que je parle proprement de l'Internet, et non des sites autres auquels on peut accéder via une connexion Internet, chatrooms, newsgroups

De cela que conclure ? Que les «autoroutes de l'information» ressemblent fort aux autoroutes réelles: leur utilisation ne dépend pas des possibilités offertes, mais du comportement de qui les fréquente. Entre Paris et Montpellier il y a beaucoup de péages; certains s'arrêtent souvent en cours de route, certains font Paris-Montpellier d'une traite. On peut trouver beaucoup de choses sur Internet, encore faut-il avoir le désir et les moyens culturels ou intellectuels de les chercher…


Addendum au 05/07/2004

Au jour où j'ajoute ceci, le nombre de pages recensées est passé à 4.285.199.774 (ou: environ 4,3 milliards), soit environ, 1,3 milliards de plus en un an et un mois, ou, si vous aimez les pourcentages et les fractions, environ 1/3 de plus, ou 30% de plus (et en version médiatique 30,23%), ou selon comme on le voit une augmentation de 43% donc des 2/5° environ, bref, en à peine plus d'un an, une sacrée progression. La question de la «flèche du temps» ne se posant pas vraiment avec Internet (comme tout y est instantané et présent en permanence, c'est un lieu atemporel), on a donc un phénomène du genre décrit dans le paradoxe de Zénon ou «paradoxe d'Achille et la tortue»: dans 55.000 ans, une fois épuisées des 4,3 milliards de pages de juillet 2004, entretemps au moins autant seront apparues, donc dans tous les cas, on n'épuisera jamais le parcours de nos «autoroutes».


Addendum au 20/12/2004

On n'arrête pas le progrès, ici celui du nombre de pages recensées, qui fit un bond prodigieux les cinq mois et demi derniers: on en est à 8.058.044.651, soit un quasi doublement en 163 jours (47% ou 88%, ça dépend de si on calcule selon la progression ou selon l'état antérieur), ou une progression d'environ 23.146.288 pages par jour en moyenne. À comparer à la progression d'environ 1,2 miliards de pages de fin décembre 2002 au 5 juillet 2004: en progession relative 43% mais en nombre de pages par jour 2.173.913, soit dix fois moins que dernièrement.


P.S.: Comment naît l'idée d'un texte.
Un visiteur récent (au 1° juin 2003 précisément), accéda à certaines de mes pages. Grâce à Free j'ai le moyen de savoir lesquelles, ce qui m'intéresse assez. Une des pages visitées fut le sommaire de la rubrique «Divers». Du coup, je l'ai relue, et la relecture de la «note de bas de page» m'a donné l'idée de ce nouveau texte.


[1] Promotion gratuite: j'utilise uniquement le moteur de recherche Google, pour deux raisons, je le trouve simple et agréable d'utilisation, et contrairement aux concurrents (Yahoo !, Alta Vista et autres), il ne vous inonde pas de publicités mal venues, de cookies et autres cochonneries. De ces deux raisons vient une troisième: c'est le plus rapide des moteurs de recherche les plus courants.
[2] Pour qui utilise Google sans avoir jeté un œil aux “Préférences”, on peut paramétrer le nombre de références par pages, de 10 (valeur par défaut) à 50; je parle de la trentième référence, parce que que dans mon cas j'ai défini un défilement de trentes références par page… Incidemment, et pour une mise à jour de cette page au 20/12/2004, à cette date Google recense 12.900.000 pages “environ”.